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Автоматизированная система 
стенографирования 


В статье рассматривается проблема построения автоматизированной системы стенографирования, 
предназначенной для оптимизации работы операторов-стенографистов в организациях и учреждениях, 
где требуется ведение текстовых стенограмм заседаний, собраний, докладов, конференций. Авторами 
рассмотрены преимущества и недостатки существующих программных продуктов и систем и предложен 
прототип системы автоматизированного стенографирования. 


Введение 


Текстовая стенограмма заседания является необходимой составляющей в работе 
многих организаций. Как правило, процесс создания и расшифровки стенограмм 
достаточно продолжителен и попытки его ускорения путем расширения персонала, 
вовлеченного в процесс, представляются неэффективными. Для автоматизации про- 
цесса создания стенограмм заседаний предлагается рассматриваемая система распре- 
деленного компьютерного документирования. 

Поскольку стенографирование заседаний является задачей, которая может быть 
достаточно просто распределена между многими исполнителями, система распреде- 
ленного стенографирования должна поддерживать однопользовательский и многополь- 
зовательский режимы работы. На сегодняшний день в мире существует несколько 
систем распределенного документирования, однако практически всем им свойственнен 
ряд недостатков, от которых авторы стремились избавить предложенную систему. 
Основным недостатком существующих систем стенографирования заседаний является то, 
что они предъявляют высокие требования к аппаратному обеспечению, на котором рабо- 
тает серверная часть системы и существенные затраты на внедрение системы в целом. 
Такие системы зачастую требуют постоянного системного администрирования [1-3], 
что ограничивает внедрение подобных систем стенографирования в небольших орга- 
низациях, организациях с ограниченным ИТ бюджетом, а также для индивидуальных 
пользователей. Наличие серверной части также делает практически невозможной мо- 
бильную работу с системой и требует постоянного подключения к локальной сети. 

Предложенная в статье система распределенного стенографирования предназначена 
автоматизировать и упростить работу индивидуальных операторов-стенографистов и 
групп стенографистов в организациях различного уровня и является продолжением 
работы над системой автоматизированного стенографирования [4]. Очевидным является 
факт, что навыки работы с компьютером операторов-стенографистов в большинстве 
организаций являются относительно ограниченными, что накладывает особые 
требования на пользовательский интерфейс и эргономику системы автоматизированного 
стенографирования. В частности, как можно большая часть операций в такой системе 
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должна быть автоматизирована и не требовать каких-либо действий от пользователя, 
а набор операций, где действие пользователя необходимо, должен быть ограниченным и 
состоять из небольшого числа простых и понятных операций. При этом система должна 
оставаться гибкой и поддерживать достаточно большое количество настроек, чтобы 
сделать работу оператора как можно более простой. 


Требования к системе распределенного 
стенографирования и характеристики 
предложенной системы 


Эффективная система автоматизированного стенографирования должна удовле- 
творять следующим требованиям: 

— Получать и сохранять звуковой сигнал с речью, предназначенной для стенографи- 
рования, поддерживать значительную часть современных форматов хранения звуковой 
информации. 

— Реализовывать предварительную цифровую обработку звукового сигнала, в част- 
ности обесшумливание сигнала. 

— Выполнять автоматическую разбивку сигнала на сегменты, продолжительность 
которых была бы максимально удобной для обработки стенографистом. 

— Поддерживать однопользовательский и многопользовательский режимы работы 
системы, при этом не требуя комплексного внедрения и сопровождения в рамках 
организации. 

— В многопользовательском режиме эффективно распределять сегменты речевого 
сигнала между операторами-стенографистами. 

Очевидным является факт о том, что уровень компьютерной грамотности опе- 
раторов-стенографистов традиционно не высок, что предъявляет особые требования к 
эргономике системы и удобству пользовательского интерфейса. 

Рассматриваемая система обладает следующими характеристиками: 

— Пользовательский интерфейс соответствует основным требованиям, которые тра- 
диционно предъявляются к эргономике и интерфейсу программного продукта. В част- 
ности, согласно классическому исследованию Д. Миллера про кратковременную память 
человека, который утверждает, что человек может одновременно концентрировать вни- 
мание лишь на 7+/-2 объектах, количество основных команд, доступных пользова- 
телю при работе с речевым сигналом, сведено к 8, а оптимальная продолжитель- 
ность сегмента звукового сигнала определена на уровне 5 — 9 слов. К тому же для 
всех основных команд в интерфейсе реализованы «горячие клавиши», с целью дать 
пользователю возможность управлять программным продуктом, не отрывая рук от кла- 
виатуры и не прекращая набора текста стенограммы. 

— Система выполняет эффективную разбивку звукового сигнала на эквивалентные 
сегменты. Такая разбивка реализовывается согласно следующему принципу: алгоритм 
разбивки проходит по сигналу окном заданной длины и определяет фрагменты сигнала, 
соответствующие паузам в речевом потоке (среднеквадратичное отклонение в таких 
сегментах не превышает заданной пороговой величины). Согласно найденным паузам 
определяются границы сегмента с условием, что продолжительность сегмента должна 
быть не меньше заданной величины и чтобы количество пауз в рамках сегмента 
соответствовало оптимальному количеству слов в сегменте. Паузы, продолжительность 
которых превышает заданный порог, вырезаются из рассматриваемого сигнала. 
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— Система работает как в однопользовательском, так и в многопользовательском 
режимах. 
— Среди объединенных в сеть компьютеров, на которых установлена система, один 
определяется как главный. Он выполняет роль сервера, обеспечивает получение 
сигнала, его предварительную цифровую обработку, разбивку сигнала на сегменты и 
распределение сегментов между остальными компьютерами. Таким образом система 
практически не требует внедрения и администрирования. 
— При предварительной обработке звукового сигнала система изменяет амплитуду 
звукового сигнала, чтобы уровень громкости оставался комфортным для стенографи- 
рования, изменяет частоту основного тона и скорость воспроизведения сигнала. 
— В многопользовательском режиме система эффективно распределяет сегменты между 
операторами-стенографистами. На главном компьютере сегменты, полученные в 
результате предварительной обработки, организованы в виде очереди, при освобождении 
оператора система направляет ему следующий в очереди сегмент, нуждающийся в 
расшифровке. 

Интерфейс АРМ оператора-стенографиста представлен на рис. 1. 
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Сегодня в области компьютерного моделирования наблюдаются новые классы задач, 
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Рисунок 1 — Интерфейс АРМ оператора-стенографиста 


Предварительная цифровая обработка сигнала 


Важным аспектом для системы автоматизированного стенографирования является 
возможность изменения скорости воспроизведения звукового сигнала, возможность 
воспроизведения звукового сигнала быстрее или медленнее без утраты его основных 
акустических характеристик: частоты основного тона и амплитуды. Для манипуляций 
над частотой основного тона и продолжительностью сигнала для создания эффектов 
медленного или быстрого воспроизведения в данной работе предлагается использование 
РЗОГА-подобных алгоритмов. Для реализации таких алгоритмов сперва решается 
задача обнаружения периодов псевдопериодичности в звуковом сигнале (рис. 2). Для 
этого исходный звуковой сигнал пропускается через низкочастотный и высокочастотный 
фильтры с конечными импульсными характеристиками. Результат применения такого 
рода фильтров к звуковому сигналу, соответствующему слогу «ма», приведен на рис. 3. 
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Рисунок 2 — Слог «ма» до применения фильтров 
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Рисунок 3 — Слог «ма» после фильтрации 


Далее для сглаживания сигнала каждый элемент вектора исходного сигнала 
заменяется на взвешенное среднее четырех окружающих его элементов по формуле: 


ая 2+ = +3 +2] а 


К полученному сигналу применяется медианное сглаживание порядка и =199, 
(каждый элемент вектора заменяется на медиану вектора, состоящего из п элементов, 
окружающих текущий элемент). Вид сигнала после сглаживания представлен на рис. 4. 
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Рисунок 4 — Слог «ма» после фильтрации и медианного сглаживания 


После этого в полученном сигнале обнаруживаются точки, где последователь- 
ность, состоящая из элементов вектора сигнала, изменяет знак с - на + и такие точки 
обозначаются как границы питч-периодов. Среди определенных таким образом гра- 
ниц обнаруживаются и исключаются точки, расположенные слишком близко друг к 
другу, а для участков сигнала, где нет явной псевдопериодичности, назначаются услов- 
ные границы с некоторым постоянным интервалом. 

После определения границ периодов псевдопериодичности можно изменять 
акустические характеристики сигнала. Исходный сигнал можно представить в виде 
функции периодов основного тона х,[и]: 


М] = Ужи-ь[], ©) 


1=—0 
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где [П] — границы периодов псевдопериодичности сигнала, т.е. разница между 
двумя соседними границами Р[П=#[Й-Е [1-1 равняется периоду основного тона 


в момент времени [,[1 |]. Питч-период определим через исходный сигнал, помноженный 
на оконную функцию: 


хАт= ити], (3) 
где окна и удовлетворяют условию: 
Умит-ш ИТ, (4) 


что достигается использованием оконных функций типа Хэннинга или трапециевидным 
окном длиной в два периода основного тона. 


В результате работы алгоритма необходимо получить сигнал У[п], который имеет 
одинаковые с х[п] спектральные характеристики, но отличается от него основным то- 
ном и/или продолжительностью. Чтобы достичь этого, заменяем аналитические гра- 
ницы питч-периодов Е&,[ ] границами (,[1], а аналитические периоды основного тона 


х[п] периодами у[и] согласно 


[.) 
Ит= У уИт-ш[ Л]. (5) 
Е 
Таким образом, теперь достаточно лишь задать границы #,[1], которые соответ- 
ствуют продолжительности и основному тону, которые необходимо получить. Резуль- 
тирующий период основного у,[и] тона получаем подстановкой ближайшего соот- 


ветствующего аналитического периода х,[п]. Графически работа алгоритма представ- 
лена на рис. 5. 
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Рисунок 5 — Схема работы алгоритма для модификации продолжительности 
и основного тона 
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Выводы 


После реализации прототипа системы был проведен эксперимент, целью которого 
было сравнение эффективности работы одного стенографиста и группы стенографистов 
при использовании предложенной системы и без такового, то есть при использовании 
лишь традиционных средств (таких как \тдо\$ МеФа Р1ауег для воспроизведения 
звукового сигнала и Мсгозой ОЁйсе \ота для набора текста стенограммы). В качестве 
входящего речевого сигнала для эксперимента была выбрана запись заседания специ- 
ализированного ученого совета по поводу защиты диссертации продолжительностью 
около 2 часов. В результате эксперимента получены следующие результаты: 

— При работе одного оператора-стенографиста на стенографирование записи с исполь- 
зованием предложенной системы было потрачено около 4 часов. Для стенографи- 
рования этой же записи при использовании стандартных средств оператор тратит в 
среднем 12 — 16 часов. 

— Группе стенографистов из 5 человек для обработки записи понадобилось около 
40 минут, после чего полученный текст стенограммы был направлен на обработку кор- 
ректору. Вместе с коррекцией в общей сложности расшифровка стенограммы заняла 
около | часа. 

Проведенный эксперимент демонстрирует эффективность предложенной системы 
в сравнении с традиционными средствами. Вместе с остальными преимуществами, 
среди которых отсутствие необходимости администрирования и внедрения, простота 
в использовании и качественная предварительная обработка сигнала, предложенная 
система является достаточно эффективным средством для автоматизации процесса 
создания и расшифровки стенограмм заседаний для небольших и крупных организаций, 
а также для индивидуальных пользователей. 
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Автоматизована система стенографування 

У статт! розглядаеться проблема побудови автоматизовано! системи стенографування, що призначена 
для оптимзаци роботи операторлв-стенографуств в органзащях 1 установах, де необх1дне ведення 
текстових стенограм зас1дань, допов1дей, конференщй. Авторами розглядаються переваги 1 недолки 
1снуючих систем 1 пропонуеться прототип системи автоматизованого стенографування. 


Уи. (. Кгууопо5, Ти.И. КгаЕ, О.Т. ВагтаЕ, 0.5. Хазуаз@т 

Ашотаед Тгапзстрбоп Зу$ет 

ТБе рарег 15 деуфе4 {0 ргоет оЁ ащютае4 бапзсирноп зузет сопзбгасйоп пицеп4еа ю орйтл2е Фе 
тапзсирноп ргосеззез шуоуште гапзстриоп орегафог$ ш огоаттаНопз уБеге гапзсириоп 15 гедие4 Юг 
теейп25, герог$, сопегепсез. Аифог$ апа[уте ргоз ап соп$ оЁ ех13Ипс зузбетз ап4 5и2е5 а ргоюбуре оЁ 
аюта{е4 гапзсгтрноп зузет. 


Статья поступила в редакцию 09.06.2009. 
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